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摘 要 : 针对 学 者 社交 网 络 的 独特 用 户 ， 提 出 一 种 基于 学 者 社交 网 络 的 论文 与 项 目 数据 的 协同 关联 模型 。 首 先 采 用 
两 步 特 征 选择 方法 预 处 理 数据 ， 去 除 无 关 和 完 余 特征 ， 得 到 影响 论文 与 项 目 关联 的 有 效 特 征 ; 然后 通过 文本 向 量 空 
间 模 型 TVSM(text vector space model) 计 算 论文 与 项 目 之 间 的 文本 相似 度 , 为 不 同 的 论文 /项 目 形成 推荐 集合 。 通 过 面 
向 科研 人 员 的 社交 网 络 “学 者 网 ”数据 ， 实 现 模 型 并 真实 应 用 于 学 者 网 。 在 线 应 用 情况 和 用 户 反馈 表明 ， 该 模型 具 
有 较 好 的 准确 性 和 实用 性 ， 可 更 加 充分 地 挖掘 论文 与 项 目 之 间 萤 涵 的 丰富 信息 ， 给 用 户 提供 更 加 高 效 方便 的 学 术科 
研 管理 服务 ， 为 分 析 学 术 大 数据 提出 了 新 疾 的 研究 方法 。 
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Association model of paper and project based on scholar social network 


Wang Liu, Tang Yongi, Yang Zuoxi, Fu Chengzhou, Mao Chengjie, Mao Chaodan 
(School of Computer Science, South China Normal University, Guangzhou 510631, China) 


Abstract: Considering the unique users of scholars' social networks, this paper proposes a collaborative association model 
of paper and project data based on scholars' social networks. Firstly, The proposed model uses the two-step feature selection 
method to preprocess the data, while removing the irrelevant and redundant features. So that the model would obtain the 
effective features that affect the association between the paper and the project. Then it would adopt text vector space model 
to calculate the text similarity between the paper and the project. After finishing these, it could form recommendation sets 
for different papers/projects. Through the social network "SCHOLAT" data for researchers, the model is implemented and 
applied to SCHOLAT. The online application situation and user feedback show that the model has good accuracy and 
practicability. Furthermore, it can more fully explore the potential relationship between the paper and the project, provide 
users with better academic research management services, and propose a novel research method for analyzing the academic 
big data. 
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0 引言 论文 和 项 目的 协同 关联 模型 对 于 挖掘 其 蕴涵 的 丰富 学 者 信息 
x 资源 很 有 必要 。 在 本 文中 主要 研究 论文 与 项 目 之 间 的 关联 模 
近年 来 ， 随 着 互联 网 的 高 速 发 展 ， 信 息 数据 呈现 指数 级 ”型 的 构建 ， 方 便 用 户 挖 掘 两 者 之 间 的 关系 。 考 虑 到 在 论文 / 
增长 ， 如 何 从 海量 的 数据 中 获取 有 效 的 信息 数据 成 为 数据 挖 ”项 目 中 存在 很 多 不 同 特征 属性 ， 需 要 在 挖掘 信息 之 前 ， 对 数 
掘 的 重要 挑战 之 一 中。 社交 网 络 也 是 如 此 ， 大 量 的 论文 、 项 据 进 行 预 处 理 和 特征 选择 。 这 些 特征 之 中 ， 对 于 论文 与 项 
目 等 学 术 成 果 信息 导致 学 者 社交 网 络 出 现 了 信息 过 载 问 题 站 ， 关联 关系 而 言 ， 有 的 是 有 效 特征 ， 有 的 是 无 关 特征 和 元 余 特 
学 者 用 户 对 于 论文 与 项 目的 关系 挖掘 需求 也 日 益 激 增 。 其 中 ， 征 。 基 于 此 问题 的 考虑 ， 在 此 模型 中 使 用 了 两 步 特征 选择 方 
最 能 体现 学 者 科研 成 果 信息 的 论文 和 项 目 ， 药 涵 了 丰富 的 学 。 ”法 内， 对 论文 的 特征 和 项 目的 特征 进行 预 处 理 ， 得 到 有 效 的 
者 信息 资源 ， 这 使 得 它们 在 学 者 社交 网 络 中 的 占据 了 十 分 重 ”论文 特征 和 项 目 特征 。 由 于 在 学 者 社交 网 络 中 ， 论 文 与 项 
要 的 地 位 。 但 是 目前 ， 用 户 难 以 充分 的 挖掘 两 者 蕴涵 的 有 效 。 的 存在 大 多 通过 文本 格式 存储 ， 在 借鉴 了 传统 的 协同 过 滤 推 
信息 ， 关 于 学 者 社交 网 络 的 论文 和 项 目 协同 关联 模型 研究 很 。 荐 模型 的 基础 上 , 采用 了 TVSM 模型 计算 论文 与 项 目 之 间 的 
少 。 因 此 ， 如 何 针对 于 学 者 社交 网 络 的 特殊 学 者 用 户 ， 为 其 ”文本 相似 度 ， 形 成 不 同 论文 邻 域 /项 目 邻 域 ， 由 相似 度 从 大 到 
提供 准确 、 个 性 化 的 论文 /项 目 推荐 ， 以 便 用 户 能 够 更 好 地 关 ”小 排序 找到 目标 论文 /项 目的 推荐 集合 。 结合 用 户 的 需求 输入 ， 
联 论文 与 项 目 ， 充 分 挖掘 论文 与 项 目 之 间 的 信息 ， 成 为 了 一 “形成 最 终 的 推荐 集合 ， 为 用 户 提供 更 加 准确 的 、 个 性 化 的 论 
个 咪 需 解决 的 研究 课题 。 文 /项 目 关联 选择 ， 最 终 将 协同 关联 模型 可 视 化 展现 。 通 过 协 
关联 规则 挖掘 是 数据 挖掘 研究 中 的 一 个 重要 分 支 , 它 能 司 关 联 模型 ， 可 以 更 加 清晰 、 深 入 地 了 解 的 论文 与 项 目 之 间 
帮助 用 户 发 现 大 量 数 据 集中 的 某 种 潜在 关系 局 。 因 此 ， 建 立 。 的 包含 信息 ， 发 现 它们 的 潜在 的 关系 ， 可 从 更 多 不 同 f 
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度 进行 数据 挖掘 ， 为 用 户 提供 一 种 准确 、 个 性 化 和 实用 的 科 — 似 度 计算 的 基础 上 , 本 文采 用 了 TVSM 模型 计算 论文 与 项 上 
研 信息 管理 工具 。 本 文 提出 的 基于 学 者 社交 网 络 的 论文 与 项 。” 之 间 的 文本 相似 度 ， 找 到 目标 论文 /项 目的 邻居 集合 ， 形 成 扒 
目 数据 关联 模型 真实 运用 于 学 者 网 ， 通 过 调查 分 析 用 户 的 反 。” 荐 集合 并 结合 用 户 的 个 性 化 需求 向 用 户 推荐 。 

馈 情 况 显示 ， 此 模型 具有 较 好 的 准确 性 和 实用 性 。 MET 

馈 情 况 此 模型 具有 较 好 的 准确 性 和 实用 2 ”模型 设计 与 实现 


T EE 2.1 特征 选择 方法 
近年 来 ， 基 于 社交 网 络 的 论文 推荐 研究 有 很 多 ， 黄 泳 航 在 两 步 特征 选择 方法 中 ，RELIEF 算法 具有 运行 效率 高 ， 
等 个 针对 学 术 社 交 网 络 特有 的 社交 性 ， 构 建 了 基于 社区 划 ”对 噪声 有 容错 能 力 ， 不 受 特征 交互 影响 等 特点 ， 因 此 适用 于 
分 的 学 术 论 文 推荐 模型 。 在 学 术 社 交 网 络 中 ， 通 过 标签 传播 ” 复杂 的 社交 网 络 数据 。 特 征 选 取 第 一 步 ,使 用 RELIEF 算法 图 
划分 社区 ， 并 依据 划分 结构 在 各 社区 内 部 的 用 户 之 间 推 荐 学 ”去 除 特征 矩阵 中 的 与 项 目 和 论文 关联 不 相关 的 特征 。 设 有 原 
术 论 文 。 陈 国 华 等 人 针对 于 学 者 网 计算 机 类 论文 语料库 始 的 数据 集 Do(bsoxssssxs e execs ,原始 数据 中 的 两 个 
提出 了 基于 单个 词 的 语义 向 量 计 算 学 术 论文 文档 的 语义 向 数据 集 Qsoes sx Oe Yes vd 分 别 代 表 论 文 和 项 目的 特征 集 
的 搜索 方案 ， 并 真实 应 用 于 学 者 网 。 汤 志 康 等 人 中 提出 了 合 。 从 训练 集 D 中 选取 一 个 样本 R,R FH P Zu di Doo 
种 学 术 社 交 平 台 相 似 论文 推荐 算法 。 该 算法 首先 用 ANSJ 对 ” 组 成 '，? 为 特征 数 ，R()) 为 样本 R 的 第 j 个 特征 的 值 。 两 个 
论文 进行 分 词 并 统计 词 条 的 TF-IDF， 然 后 通过 Word2Vec 把 。 样 例 R,R 关 于 特征 j 的 距离 定义 如 下 : 
论文 映射 到 一 个 高 位 向 量 ， 并 使 用 余弦 相似 度 计算 相似 度 。 a) 当 特 征 为 非 数 值 型 变量 时 
这 些 研究 只 涉及 到 学 术 论 文 的 相关 搜索 推荐 ， 并 没有 考虑 到 Lif RG)-RG) gd) 
学 者 项 目 也 草 涵 着 丰富 的 学 者 信息 ， 也 没有 深入 研究 论文 与 Oif RG)*RG) 
项 目的 协同 关联 。 b) 当 特 征 为 数值 型 变量 时 

针对 于 学 者 社交 网 络 , 在 论文 /项 目 中 有 很 多 不 同 的 特征 Q) 
属性 ， 在 挖掘 相关 信息 之 前 ， 需 要 对 数据 进行 预 处 理 和 特征 max( j) - min( j) 
选择 。 在 数据 的 预 处 理 和 特征 选择 方面 ，Kira 等 人 外 提出 了 其 中 : max( 让 ,min( 四 分 别 表示 特征 J 的 最 大 最 小 取 值 。 该 算法 
RELIEF 算法 ， 这 是 一 种 经 典 的 基于 二 分 类 的 特征 权重 算法 。 ”通过 找到 与 R 同类 的 最 近邻 样本 RH 以 及 与 * 非 同类 的 最 近 
该 算法 依据 各 个 特征 和 类 别 的 相关 性 赋予 不 同 的 权重 值 ， 权 MR RM ， 然 后 依据 样本 R 与 它 的 两 个 最 近邻 样本 在 特征 
重 小 于 设 定 阔 值 的 特征 会 被 移 除 ， 最 后 得 到 各 个 特征 的 平均 7 上 的 距离 差 更 新 特征 j 的 权重 ， 如 式 G) 所 示 。 
权重 。 由 于 RELIEF 局 限于 二 分 类 问题 ， 张 翔 等 人 印 通 过 融 wo) -wo BD RA , diff RG) RMG) Q) 
S ERCKIRUCKA SC. XT TIS. LRR m 
线 数据 ， 提 出 了 新 的 RELIEF 特征 加 权 算 法 ， 具 有 更 好 的 适 其 中 : WO 为 特征 j 的 权重 ， 初始 特征 权重 均 为 0; mm 为 随 
应 性 。 但 是 该 算法 由 于 赋予 了 所 有 和 类 别 相关 性 高 的 特征 较 ” 机 抽取 样本 的 次 数 ，i 为 抽取 的 第 i 个 样本 。 通过 mm 次 的 迭代 
高 的 权重 值 ， 所 以 该 算法 存在 不 能 有 效 去 除 元 余 特 征 的 局 限 ” 之 后 ,可 得 到 每 个 特征 的 平均 权重 。 权重 值 越 大 ,说 明 该 特征 
性 。Ding 等 人 外 在 分 析 了 社交 网 络 中 用 息 之 后 ， 提 ”的 分 类 能 力 更 好 ， 越 能 代表 该 类 别 。 算 法 运行 结束 后 ， 将 权 
出 了 一 种 融合 RELIEF 算法 和 天 -means 算法 的 两 步 特征 选择 ” 重 集 合 7 按照 从 大 到 小 排序 ， 依 据 给 定 阔 值 去 除权 重 小 于 
方法 ， 取 得 更 好 的 特征 集合 。 实 验 结果 也 表明 该 算法 适用 于 BERRE. 
复杂 的 社交 网 络 数据 ， 具 有 较 好 的 性 能 。 通过 第 一 步 的 RELIEF 特征 选择 方法 后 ， 过 滤 了 特征 选 

为 了 解决 社交 网 络 中 存在 的 信息 过 载 问题 ， 推 荐 系统 应 ”项 中 的 无 关 特 征 ， 但 是 得 到 的 特征 集合 仍 存在 部 分 的 元 余 特 
运 而 生 。 在 推荐 算法 中 ， 协 同 过 滤 算 法 (collaborative WE. 在 第 二 步 特征 选择 中 ,将 通过 结合 K-means 聚 类 算法 08l 
filtering,CF) 是 个 性 化 推荐 系统 最 为 成 功 的 算法 之 一 ， 该 类 算 解决 该 问题 。K-means 是 一 种 基于 划分 的 无 监督 算法 ， 能 够 
法 主要 通过 用 户 一 项 目 评分 矩阵 ,进行 相似 度 计 算 , 找 出 目标 简单、 快速 地 解决 聚 类 问题 ， 对 于 大 数据 集 的 处 理 ， 也 有 具有 
用 户 的 邻居 集合 进行 推荐 。 目 前 主要 有 基于 记忆 的 协同 过 滤 ”很 好 的 伸缩 性 和 高 效 性 。 通 过 第 一 步 选 择 得 到 了 过 滤 了 无 关 
算法 (memory-based CF)00 和 基于 模型 的 协同 过 滤 算 法 特征 的 特征 集 7 ， 给 定 需要 划分 数据 集 的 复数 上 ， 首 先 通 过 
(model-based CF)IU 两 种 类 型 。 其 中 ,基于 记忆 的 协同 过 滤 随机 选择 距离 尽 可 能 远 的 个 起 始点 作为 x 个 簇 类 的 质心 ; 
法 可 以 划分 为 基于 用 户 的 协同 过 滤 算 法 (user-based CF)02 和 ”然后 通过 计算 数据 集中 剩余 点 与 各 个 秘 的 质心 距离 远近 ， 将 
基于 物品 的 协同 过 滤 算 法 (item-based CF)03。 该 类 算法 往往 。” 剩余 点 分 配 到 距离 最 近 的 艇 类 。 对 于 每 一 个 艇 类 ， 计 算 簇 类 
通过 用 户 一 物品 评分 矩阵 ,结合 相似 度 算法 , 计算 不 同 用 户 / ” 中 所 有 样本 的 均值 作为 新 的 质心 ， 若 质心 收敛 则 结束 ; 否则 
物品 的 相似 度 ， 以 此 找到 目标 用 户 / 物 品 的 最 相似 用 户 / 物 品 。 继续 迭代 计算 除去 新 的 质心 后 剩余 点 到 新 质心 的 距离 ， 以 同 
构成 最 近邻 居 和 集合 ， 形 成 推荐 集 。 在 该 类 协同 算法 中 ， 相 似 。” 样 的 方式 选 出 新 的 质心 ， 直 至 最 终 收敛 ， 或 者 达到 达 代 的 上 
度 计 算是 关键 的 步 又 之 一 。 作 为 衡量 两 个 个 体 之 间 差 异 的 大 ” 限 则 结束 聚 类 过 程 ， 得 到 最 终 的 聚 类 结果 。 同 一 个 簇 内 的 相 
小 ， 相 似 度 越 高， 说 明 个 体 间 的 差异 往往 较 小 ， 依 据 相 似 度 。 ” 似 度 较 高 ， 不 同 簇 间 的 相似 度 较 低 。 结 合 第 一 步 中 得 到 的 特 
的 推荐 的 质量 也 通常 越 好 。 在 相似 度 的 计算 中 ， 度 量 的 方法 征 权 重 ， 删 除 同 徐 中 权重 值 较 低 的 宛 余 特征 ， 得 到 最 终 影响 
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目前 主要 有 余弦 相似 性 [时 、 调 整 的 余弦 相似 性 0 习 和 Pearson ”项 目 和 论文 关联 的 有 效 特征 。 

相关 系数 59， 根 据 实际 的 数据 情况 进行 合适 的 度量 方法 选择 。 融合 RELIEF 和 天 -means 算法 的 两 步 特征 选择 方法 的 算 
综 上 所 述 ， 在 本 文 提 出 的 模型 中 采用 更 适合 社交 网 络 环 ”法 流程 如 图 1 所 示 。 

境 下 融合 RELIEF 算法 和 天 -means 算法 的 两 步 特 征 选择 方法 融合 RELIEF 和 天 -means 的 两 步 特征 选择 算法 的 伪 代 码 

进行 原始 数据 的 特征 选择 。 在 此 基础 上 ， 考 虑 到 论文 和 项 上 如 下 : 


的 特征 属性 主要 由 自然 语言 文本 构成 ， 在 借鉴 传统 协同 过 滤 ”两 步 特征 选择 算法 : 
推荐 算法 相似 度 计算 和 传统 的 空间 向 量 模型 VSMI7 特 征 相 
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王 Bp X: 

Input: Training set D —((xiX), s X J {Yo Yos S Yd) 

Sample size m, Selected Rounds of Sample R, 

Number of features. p; 

Threshold o; Feature Weighting Set T; Feature Weighting W ( ); 

distance diff ( ); 

Number of cluster k;cluster = (,,0,,...,c,): number of Clustering q 

Process: 

IT-O0; W( )={0,0,.…,0} 

2 for tz 1... m: 

3 select sample R randomly from D 

4 select the neighbor set H,M of R from the samples of same 
class and different class respectively 

5 for j-l...p: 


6 W(RCJ)) »W (RCJ)) - diff (RG), RH Cj)) / m+ diff (RCJ), RM (j))/ m 
7 for j=1,...,p 

8 if W(j)za then: 

9 T.append (D;) 


0 Remove irrelevant features from T and return new features Fnew 
1 select k features randomly form Fnew as original centroids, 
F is the remaining features that removes the centroids 
12for t=1,..., q: 
3 for f, inF: 
4 for c, in cluster: 
5 compute the distance between f, and c, 
16 putthe f, into the closet (the minimum distance) c, 
7 | update the centroid of every cluster 


8 if centroids convergence then: 


个 文本 的 
HERIZ 


基于 学 者 社交 网 络 的 论文 与 项 目 关联 模型 


Drs #(w) 表 示 当 
表示 有 多 少 个 文本 出 现 了 vw; 
Edu] TF-IDF fH. i 
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前 词 wi 在 某 个 文本 中 出 现 的 频率 ; df (wi) 
n 表示 文本 总 数 。 由 此 得 到 每 
为 每 篇 文本 构建 向 量 模型 ， 


所 示 。 


Am 


D 


N 


18 


模型 计算 论文 


目 似 度 09 计 算 文本 这 


根据 相似 度 的 从 大 到 小 排序 , 形成 


间 的 相似 度 ,计算 方法 如 式 (5) 


(5) 


标 论文 /项 目的 最 近 


大 集合 ， 可 以 为 | 


j 户 提供 选取 的 推荐 集合 。 


.3 协同 关联 模型 


论文 /项 目 协同 


ua 


关联 模型 的 框架 如 图 2 所 示 。 主 要 组 成 包 


a) 两 步 特 有 


E 选 择 有 效 的 论文 和 项 


TRAE: b) 运用 TVSM 


用 户 的 个 性 化 需求 ， 


论文 与 项 目 关 


论文 /项 目 
原始 数据 


与 项 目的 文本 相似 度 得 到 相似 推荐 引 


c) 结合 
标 论文 /项 目的 推荐 结果 ; d) 


mt 


形成 最 终 


居 ， 系 统 同 步 更 新 。 


用 户 个 性 化 需求 
© 推荐 集合 


算 ， 计算 方法 如 式 (4) 所 示 。 


TF - IDF (w;) 2 tf (w;)xlog 


df (wj) e 


9 break; 
20 end 目标 论文 /项 目 关 联 。 / 论文 与 项 目 协 
Output cluster 422. - ERR 
开始 T 
学 者 网 论 文 和 项 
目 原始 数据 集 可 视 化 同步 重 
T 
y : 支持 可 视 化 同步 更 协同 关联 模型 
论文 特征 数据 集 项 目 特征 数据 集 新 的 协同 关联 模型 
" " q2 ”基于 学 者 社交 网 络 的 论文 与 项 目 数据 协同 关联 模型 
E E Fig.2 Association model of paper and project based on scholar social 
pude poc up network 
论文 特征 数据 项 目 特征 
: | 本 文 所 提出 的 协同 关联 模型 ， 是 针对 于 学 者 社交 网 络 的 
K-means— 去 除 宛 余 特征 &—K-means 特殊 学 者 ， 为 其 最 具 代 表 信息 的 学 术 成 果 论 文 和 项 目 提供 协 
(€ 同 关联 。 考 虑 到 论文 和 项 目 信息 本 身 含 有 大 量 的 无 关 和 元 余 
特征 ， 首 先 通过 RELIEF 算法 根据 各 个 特征 和 类 别 的 相关 性 
赋予 特征 不 同 的 权重 值 ， 移 除 小 于 阔 值 的 无 关 特 征 ， 然 后 通 
结束 i K-means 聚 类 算法 依据 相似 性 度量 将 特征 划分 为 上 个 复 ， 
图 1 两 步 特征 选择 方法 流程 将 簇 内 权 值 较 低 的 特征 除去 ， 也 就 是 去 除 元 余 特 征 。 通 过 融 
Fig. 1 Two - step feature selection method flow chart 合 这 两 种 算法 的 两 步 特征 选择 方法 进行 有 效 的 特征 选择 ， 预 
2.2 TVSM 模型 处 理 数据 。 而 由 于 论文 和 项 目的 信息 基本 上 是 由 文本 组 成 ， 
在 本 文 的 模型 中 ， 为 了 更 好 地 实现 论文 和 项 目的 协同 关 ”结合 文本 向 量 空 间 模型 TVSM 来 计算 文本 特征 之 间 的 相似 
联 ， 需 要 对 目标 论文 /项 目 提 供 更 加 准确 的 推荐 结果 , 方便 用 度 。 先 将 论文 信息 和 项 目 信 息 分 别 进行 分 词 处 理 ， 通 过 
户 更 好 地 从 推荐 集中 选择 对 应 的 论文 /项 目 进行 关联 。 去 除 无 ”TF-IDF 给 每 个 词组 中 的 词 赋予 权重 值 ， 构 成 特征 向 量 ,最 后 
关 和 元 余 特 征 后 ， 考 虑 到 论文 信息 和 项 目 信息 大 部 分 由 自然 。 通过 利用 余弦 相似 计算 文本 之 间 的 相似 度 。 通 过 上 述 的 计算 
语言 组 成 , 本 文采 用 了 TVSM 模型 来 计算 不 同文 本 之 间 的 相 。 后, 按照 相似 度 大 小 排列 ,可 以 得 到 各 个 不 同 的 论文 /项 目的 
似 度 。 首 先 将 论文 和 项 目 信 息 分 别 进行 分 词 处 理 ， 得 到 论文 ”相似 推荐 集合 ,为 了 更 好 地 为 用 户 提 供 准确 、 个 性 化 的 推荐 ， 
T 在 学 者 网 应 用 实践 中 ， 提 供 了 个 性 化 需求 和 输入， 以便 用 户 根 
0 项 对 应 对 5] 2 D, = (Wa, Wa, Wa), D, (WWW), m "o EY 2 
di Bde i 据 自身 需求 找到 更 加 准确 的 目标 项 目 /论文 。 在 此 基础 上 ， 进 
表示 词组 中 的 词语 总 数 .然后 给 每 个 词组 中 的 词 赋予 权重 值 ， 行 论文 与 项 目 协同 关联 模型 的 建 模 ， 用 户 根据 该 模型 进行 论 
构成 特征 向 量 。 其 中 ， 权 重 值 通过 的 TF-IDF 方法 M9 进行 计 文 与 项 目的 协同 关联 , 最 终 系统 将 关联 结果 可 视 化 同步 更 新 。 


2.4 协同 关联 模型 应 用 


本 文 模型 采用 学 者 社交 网 络 一 学 者 网 的 论文 和 项 目 数据 
行 协同 关联 模型 的 构建 。 


学 者 网 ( http://www.scholat.com ) 
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F: 基于 学 者 社交 网 络 的 论文 与 项 目 关 联 模型 
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论文 的 特征 
I 等 十 几 项 之 多 ， 


Be 
项 目 特征 也 有 9 
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征 和 项 目 


J 效 特征 , 
择 论 文 数 
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关联 对 象 
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Fig. 3 
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